Travaux de mise au Point d'un Lexique en vue de la transcription francaise automatique ou Semi-automatique du Texte GREC d'aristote

نویسنده

  • Gerard Potvin
چکیده

Le travaux qui font l'objet de la prdsente communication ont ~t~ effectu~s dans le cadre d'une &ude sur la doctrine aristot~licienne du X6yo¢. Tr~s t6t dans cette &ude, l'auteur a constat~ l'impossibilit~ de pro-c~der ~t une analyse rigoureuse du texte aristot~licien sans disposer d'une transcription ou d'une traduction oh chaque dl6ment du texte aristo-t~licien soit rendu de fa~on uniforme et oh les regroupements l~ar les unit~s de famiUes, de prdfixes et de suffaxes soient maintenus exactement. Ce dont il sentait le besoin, c'&ait tree transcription automatique ou semi-automatique de ce texte; et, fi sa connaissance, auctme transcription de ce type n'&ait disponible. I1 a donc d6cid~ de s'adonner k des travaux pr~paratoires ~ une telle transcription en pr6parant une premiere tranche d'un lexique (1000 mots environ) pouvant &re utilis6 dans une tentative de transcription. II esp~re pouvoir en 1973-74 appliquer ce lexique b. une tentative de transcription semi-automatique d'au moins une partie de la Mdtaphy-sique d'Aristote. Dans l'6laboration de ce lexique, il a largement utilis6, pour des vastes op6rations de compilation, l'ordinatrice du centre de calcul de l'Universit~ de Montr&l. Une premi6re phase des travaux a consist6 ~t identifier, avec l'aide de l'Index Aristotdlicus de BOmTZ, 108 families comprenant au total pros de 3000 roots, et ~ assigner ~ chaque mot un code l'identifiant, le situant dans une famille et l'y plaqant soit comme terme-racine, soit comme terme apparent6, soit comme d6riv6, soit comme compos~ pr~verbe, soit comme compos6 de multiples racines. Durant cette phase, les meilleurs dictionnaires &ymologiques ont &6 utilis6s. Une deuxi~me phase a consists ~ faire reclasser par l'ordinatrice les

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Construction du lexique LGLex à partir des tables du Lexique-Grammaire des verbes du grec moderne

Résumé Dans cet article, nous dressons un bilan du travail effectué sur les ressources du grec moderne concernant le Lexique-Grammaire des verbes. Nous détaillons les propriétés définitoires de chaque table, ainsi que l'ensemble des changements effectués sur les intitulés de propriétés afin de les rendre cohérents. Grâce à l'élaboration de la table des classes, regroupant l'ensemble des proprié...

متن کامل

Nouvelles perspectives en extraction d'information

Les techniques dites d'extraction d'information (EI) ont connu un essor considérable ces dix dernières années. L'EI consiste à extraire de documents des informations précises et à les structurer sous une forme prédéfinie. Il s'agit en général de remplir des formulaires donnant certaines caractéristiques concernant des entités ou des événements évoqués dans les textes ainsi que des relations ent...

متن کامل

Le programme de reconstitution automatique des familles saguenayennes: données de base et resultats provisoires.

Ce texte a pour but de soumettre à la critique une partie des travaux méthodologiques réalisés dans le cadre du Projet d'Histoire sociale de la Population du Saguenay. Ces travaux ont consisté, en particulier, à mettre au point un procédé original de reconstitution automatique des familles et ils ont impliqué un certain nombre de choix techniques ou méthodologiques qui sont ici décrits. Il sera...

متن کامل

Une notation semantique et ses implications linguistiques

Une notation s~mantique et ses implications linguistiques (R6sum6) i. Une notation estpropos~e en vue de fixer la structure s~mantique d'un texte naturel de fagon a en permettre le traitement automatique ult~rieur, logique (d~duction) ou linguistique (traduction). A la difference d'un langage documentaire (ou d'information), la notation propos~e ne vise, en premier lieu qu'~ ~claircir et ordonn...

متن کامل

Study of Domain Dependant Multi-Polarity Words for Document Level Opinion Mining (Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d'opinion au niveau du texte) [in French]

Résumé. Les méthodes de détection automatique de l’opinion dans des textes s’appuient sur l’association d’une polarité d’opinion aux mots des textes, par lexique ou par apprentissage. Or, certains mots ont des polarités qui peuvent varier selon le domaine thématique du texte. Nous proposons dans cet article une étude des mots ou groupes de mots marqueurs d’opinion au niveau du texte et qui ont ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 1973